当前位置: 开发笔记 > 编程语言 > 正文

独家|使用TensorFlow2创建自定义损失函数

作者：捕鱼达人2602906405 | 来源：互联网 | 2023-09-11 05:00

作者：ArjunSarkar翻译：陈之炎校对：欧阳锦本文约1900字，建议阅读8分钟本文带你学习使用Python中的wrap

作者&＃xff1a;Arjun Sarkar

翻译&＃xff1a;陈之炎

校对&＃xff1a;欧阳锦

本文约1900字&＃xff0c;建议阅读8分钟

本文带你学习使用Python中的wrapper函数和OOP来编写自定义损失函数。

标签&＃xff1a;TensorFlow 2&＃xff0c;损失函数

图1&＃xff1a;梯度下降算法&＃xff08;来源&＃xff1a;公共域&＃xff0c;https://commons.wikimedia.org/w/index.php&＃xff1f;curid&＃61;521422 )

神经网络利用训练数据&＃xff0c;将一组输入映射成一组输出&＃xff0c;它通过使用某种形式的优化算法&＃xff0c;如梯度下降、随机梯度下降、AdaGrad、AdaDelta等等来实现&＃xff0c;其中最新的算法包括Adam、Nadam或RMSProp。梯度下降中的“梯度”是指误差梯度。每次迭代之后&＃xff0c;网络将其预测输出与实际输出进行比较&＃xff0c;然后计算出“误差”。

通常&＃xff0c;对于神经网络&＃xff0c;寻求的是将误差最小化。将误差最小化的目标函数通常称之为成本函数或损失函数&＃xff0c;由“损失函数”计算出的值称为“损失”。在各种问题中使用的典型损失函数有&＃xff1a;

均方误差&＃xff1b;
均方对数误差&＃xff1b;
二元交叉熵&＃xff1b;
分类交叉熵&＃xff1b;
稀疏分类交叉熵。

Tensorflow已经包含了上述损失函数&＃xff0c;直接调用它们即可&＃xff0c;如下所示&＃xff1a;

1. 将损失函数当作字符串进行调用

model.compile (loss &＃61; ‘binary_crossentropy’,optimizer &＃61; ‘adam’, metrics &＃61; [‘accuracy’])

2. 将损失函数当作对象进行调用

from tensorflow.keras.losses importmean_squared_error model.compile(loss &＃61; mean_squared_error,optimizer&＃61;’sgd’)

将损失函数当作对象进行调用的优点是可以在损失函数中传递阈值等参数。

from tensorflow.keras.losses import mean_squared_error model.compile (loss&＃61;mean_squared_error(param&＃61;value),optimizer &＃61; ‘sgd’)

利用现有函数创建自定义损失函数&＃xff1a;

利用现有函数创建损失函数&＃xff0c;首先需要定义损失函数&＃xff0c;它将接受两个参数&＃xff0c;y_true&＃xff08;真实标签/输出&＃xff09;和y_pred&＃xff08;预测标签/输出&＃xff09;。

def loss_function(y_true, y_pred): ***some calculation*** return loss

创建均方误差损失函数 (RMSE)&＃xff1a;

定义损失函数名称-my_rmse。目的是返回目标&＃xff08;y_true&＃xff09;与预测&＃xff08;y_pred&＃xff09;之间的均方误差。

RMSE的公式为&＃xff1a;

误差&＃xff1a;真实标签与预测标签之间的差异。
sqr_error&＃xff1a;误差的平方。
mean_sqr_error&＃xff1a;误差平方的均值。
sqrt_mean_sqr_error&＃xff1a;误差平方均值的平方根&＃xff08;均方根误差&＃xff09;。

创建Huber损失函数&＃xff1a;

图2&＃xff1a;Huber损失函数&＃xff08;绿色&＃xff09;和平方误差损失函数&＃xff08;蓝色&＃xff09;&＃xff08;来源&＃xff1a;Qwertyus— Own work&＃xff0c;CCBY-SA4.0&＃xff0c;https://commons.wikimedia.org/w/index.php&＃xff1f;curid&＃61;34836380&＃xff09;

Huber损失函数的计算公式&＃xff1a;

在此处&＃xff0c;δ是阈值&＃xff0c;a是误差&＃xff08;将计算出a&＃xff0c;即实际标签和预测标签之间的差异&＃xff09;。

当|a|≤δ时&＃xff0c;loss &＃61; 1/2*(a)²

当 |a|>δ时&＃xff0c;loss &＃61; δ(|a|—&＃xff08;1/2)*δ&＃xff09;

源代码&＃xff1a;

详细说明&＃xff1a;

首先&＃xff0c;定义一个函数—— my huber loss&＃xff0c;它需要两个参数&＃xff1a;y_true和y_pred&＃xff0c;

设置阈值threshold &＃61; 1。

计算误差error a &＃61; y_true-y_pred。接下来&＃xff0c;检查误差的绝对值是否小于或等于阈值&＃xff0c;is_small_error返回一个布尔值&＃xff08;真或假&＃xff09;。

当|a|≤δ时&＃xff0c;loss&＃61; 1/2*(a)²&＃xff0c;计算small_error_loss, 误差的平方除以2。否则&＃xff0c;当|a| >δ时&＃xff0c;则损失等于δ(|a|-&＃xff08;1/2)*δ&＃xff09;,用big_error_loss来计算这个值。

最后&＃xff0c;在返回语句中&＃xff0c;首先检查is_small_error是真还是假&＃xff0c;如果它为真&＃xff0c;函数返回small_error_loss&＃xff0c;否则返回big_error_loss&＃xff0c;使用tf.where来实现。

可以使用下述代码来编译模型&＃xff1a;

在上述代码中&＃xff0c;将阈值设为1。

如果需要调整超参数&＃xff08;阈值&＃xff09;&＃xff0c;并在编译过程中加入一个新的阈值的话&＃xff0c;必须使用wrapper函数进行封装&＃xff0c;也就是说&＃xff0c;将损失函数封装成另一个外部函数。在这里需要用到封装函数&＃xff08;wrapper function&＃xff09;&＃xff0c;因为损失函数在默认情况下只能接受y_true和y_pred值&＃xff0c;而且不能向原始损失函数添加任何其他参数。

使用封装后的Huber损失函数

封装函数的源代码&＃xff1a;

此时&＃xff0c;阈值不是硬编码&＃xff0c;可以在模型编译过程中传递该阈值。

使用类实现Huber损失函数(OOP)

其中&＃xff0c;MyHuberLoss是类名称&＃xff0c;随后从tensorflow.keras.losses继承父类“Loss”&＃xff0c; MyHuberLoss继承了Loss类&＃xff0c;之后可以将MyHuberLoss当作损失函数来使用。

__init__ 初始化该类中的对象。执行类实例化对象时调用函数&＃xff0c;init函数返回阈值&＃xff0c;调用函数得到y_true和y_pred参数&＃xff0c;将阈值声明为一个类变量&＃xff0c;可以给它赋一个初始值。

在__init__函数中&＃xff0c;将阈值设置为self.threshold。在调用函数中&＃xff0c;self.threshold引用所有的阈值类变量。在model.compile中使用这个损失函数&＃xff1a;

创建对比性损失&＃xff08;用于Siamese网络&＃xff09;&＃xff1a;

Siamese网络可以用来比较两幅图像是否相似&＃xff0c;Siamese网络使用的损失函数为对比性损失。

在上文的公式中&＃xff0c;Y_true是关于图像相似性细节的张量&＃xff0c;如果图像相似&＃xff0c;则为1&＃xff0c;如果图像不相似&＃xff0c;则为0。

D是图像对之间的欧氏距离的张量。边际为一个常量&＃xff0c;用它来设置将图像区别为相似或不同的最小距离。如果为Y_true&＃61;1&＃xff0c;则方程的第一部分为D²&＃xff0c;第二部分为0&＃xff0c;所以&＃xff0c;当Y_true接近1时&＃xff0c;D²的权重则更重。

如果Y_true&＃61;0&＃xff0c;则方程的第一部分变为0&＃xff0c;第二部分会产生一些结果&＃xff0c;这给了最大项更多的权重&＃xff0c;给了D平方项更少的权重&＃xff0c;此时&＃xff0c;最大项在损失计算中占了优势。

使用封装器函数实现对比损失函数&＃xff1a;

结论

在Tensorflow中没有的损失函数都可以利用函数、包装函数或类似的类来创建。

原文标题&＃xff1a;

Creating custom Loss functionsusing TensorFlow 2

原文链接&＃xff1a;

https://towardsdatascience.com/creating-custom-loss-functions-using-tensorflow-2-96c123d5ce6c

编辑&＃xff1a;黄继彦

校对&＃xff1a;林亦霖

译者简介

陈之炎&＃xff0c;北京交通大学通信与控制工程专业毕业&＃xff0c;获得工学硕士学位&＃xff0c;历任长城计算机软件与系统公司工程师&＃xff0c;大唐微电子公司工程师&＃xff0c;现任北京吾译超群科技有限公司技术支持。目前从事智能化翻译教学系统的运营和维护&＃xff0c;在人工智能深度学习和自然语言处理&＃xff08;NLP&＃xff09;方面积累有一定的经验。业余时间喜爱翻译创作&＃xff0c;翻译作品主要有&＃xff1a;IEC-ISO 7816、伊拉克石油工程项目、新财税主义宣言等等&＃xff0c;其中中译英作品“新财税主义宣言”在GLOBAL TIMES正式发表。能够利用业余时间加入到THU 数据派平台的翻译志愿者小组&＃xff0c;希望能和大家一起交流分享&＃xff0c;共同进步。

翻译组招募信息

工作内容&＃xff1a;需要一颗细致的心&＃xff0c;将选取好的外文文章翻译成流畅的中文。如果你是数据科学/统计学/计算机类的留学生&＃xff0c;或在海外从事相关工作&＃xff0c;或对自己外语水平有信心的朋友欢迎加入翻译小组。

你能得到&＃xff1a;定期的翻译培训提高志愿者的翻译水平&＃xff0c;提高对于数据科学前沿的认知&＃xff0c;海外的朋友可以和国内技术应用发展保持联系&＃xff0c;THU数据派产学研的背景为志愿者带来好的发展机遇。

其他福利&＃xff1a;来自于名企的数据科学工作者&＃xff0c;北大清华以及海外等名校学生他们都将成为你在翻译小组的伙伴。

点击文末“阅读原文”加入数据派团队~

转载须知

如需转载&＃xff0c;请在开篇显著位置注明作者和出处&＃xff08;转自&＃xff1a;数据派ID&＃xff1a;DatapiTHU&＃xff09;&＃xff0c;并在文章结尾放置数据派醒目二维码。有原创标识文章&＃xff0c;请发送【文章名称-待授权公众号名称及ID】至联系邮箱&＃xff0c;申请白名单授权并按要求编辑。

发布后请将链接反馈至联系邮箱&＃xff08;见下方&＃xff09;。未经许可的转载以及改编者&＃xff0c;我们将依法追究其法律责任。

点击“阅读原文”拥抱组织

推荐阅读

io
AI 学习路线：从Python开始机器学习

AI 学习路线：从Python开始机器学习 ... [详细]

蜡笔小新 2024-09-28 14:04:30
io
AI算法工程师从入门到上瘾

设定一个非常清晰的目标清晰的目标就比如说你要做NLP，你要知道NLP的应用有智能问答，机器翻译，搜索引擎等等。然后如果你要做智能问答你要知道现在最发达的技术是深度学习，使用的算法有 ... [详细]

蜡笔小新 2024-09-27 12:06:03
process
【机器学习】生成式对抗网络模型综述

生成式对抗网络模型综述摘要生成式对抗网络模型(GAN)是基于深度学习的一种强大的生成模型，可以应用于计算机视觉、自然语言处理、半监督学习等重要领域。生成式对抗网络 ... [详细]

蜡笔小新 2023-12-14 17:51:18
process
每日一书丨AI圣经《深度学习》作者斩获2018年图灵奖

2019年3月27日——ACM宣布，深度学习之父YoshuaBengio,YannLeCun,以及GeoffreyHinton获得了2018年的图灵奖， ... [详细]

蜡笔小新 2024-09-27 16:03:32
process
2018年人工智能大数据的爆发，学Java还是Python？

本文介绍了2018年人工智能大数据的爆发以及学习Java和Python的相关知识。在人工智能和大数据时代，Java和Python这两门编程语言都很优秀且火爆。选择学习哪门语言要根据个人兴趣爱好来决定。Python是一门拥有简洁语法的高级编程语言，容易上手。其特色之一是强制使用空白符作为语句缩进，使得新手可以快速上手。目前，Python在人工智能领域有着广泛的应用。如果对Java、Python或大数据感兴趣，欢迎加入qq群458345782。 ... [详细]

蜡笔小新 2023-12-14 20:08:28
process
干货 | 携程AI推理性能的自动化优化实践

作者简介携程度假AI研发团队致力于为携程旅游事业部提供丰富的AI技术产品，其中性能优化组为AI模型提供全方位的优化方案，提升推理性能降低成本࿰ ... [详细]

蜡笔小新 2023-10-16 14:03:03
process
「爆干7天7夜」入门AI人工智能学习路线一条龙，真的不能再透彻了

前言应广大粉丝要求，今天迪迦来和大家讲解一下如何去入门人工智能，也算是迪迦对自己学习人工智能这么多年的一个总结吧，本条学习路线并不会那么 ... [详细]

蜡笔小新 2023-10-16 12:17:31
ip
揭秘阿里云WAF背后神秘的AI智能防御体系

背景应用安全领域，各类攻击长久以来都危害着互联网上的应用，在web应用安全风险中，各类注入、跨站等攻击仍然占据着较前的位置。WAF(Web应用防火墙)正是为防御和阻断这类攻击而存在 ... [详细]

蜡笔小新 2023-12-11 01:30:52
ip
3年半巨亏242亿！商汤高估了深度学习，下错了棋？

转自：新智元三年半研发开支近70亿，累计亏损242亿。AI这门生意好像越来越不好做了。近日，商汤科技已向港交所递交IPO申请。招股书显示& ... [详细]

蜡笔小新 2023-10-17 16:41:52
ip
当写稿机器人真有了观点和感情，我们是该高兴还是恐惧？

目前，写稿机器人多是撰写以数据为主的稿件，当它们能够为文章注入观点之时，这些观点真的是其所“想”吗？最近，《南 ... [详细]

蜡笔小新 2023-10-17 15:17:11
ip
人工智能推理能力与假设检验

最近Google的Deepmind开始研究如何让AI做数学题。这个问题的提出非常有启发，逻辑推理，发现新知识的能力应该是强人工智能出现自我意识之前最需要发展的能力。深度学习目前可以 ... [详细]

蜡笔小新 2023-10-17 10:01:37
ip
深度学习与神经网络——邱锡鹏

深度学习与神经网络——邱锡鹏-一、绪论人工智能的一个子领域神经网络：一种以（人工)）神经元为基本单元的模型深度学习：一类机器学习问题，主要解决贡献度分配问题知识结构：路线图：顶 ... [详细]

蜡笔小新 2023-10-16 05:57:42
ip
必备核心算法神经网络通俗讲解

深度学习传统算法VS人工智能算法传统算法：都是人为去计算人工智能算法：部分人为需要做的事情交由机器去做【把更多的问题简单化】IT的发展比较高端的就是A ... [详细]

蜡笔小新 2023-10-13 13:37:46
ip
聊聊中国人工智能科技产业区域竞争力分析及趋势

原文链接：聊聊中国人工智能科技产业区域竞争力分析及趋势最近看了一个关于国内AI的报告《中国新一代人工智能科技产业区域竞争力评价指数（2021ÿ ... [详细]

蜡笔小新 2023-10-13 11:56:40
ip
百度AI Studio人流密度常规赛火热进行中，快来报名！

早晨七点半。北京初秋的凉风叫醒了住在望京西的你，睁开眼睛，一想到又要为人类的信息化事业贡献满满的正能量，你不禁哼唱起那句“早晨起来 ... [详细]

蜡笔小新 2023-10-12 18:57:29

捕鱼达人2602906405

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章